Big Data and Analytics Arrays এবং Data Frames গাইড ও নোট

401

R প্রোগ্রামিং ভাষায় ডেটা ম্যানিপুলেশন এবং বিশ্লেষণের জন্য অনেক ধরনের ডেটা স্ট্রাকচার ব্যবহৃত হয়। এর মধ্যে Arrays এবং Data Frames দুইটি গুরুত্বপূর্ণ ডেটা স্ট্রাকচার, যা বিভিন্ন ধরণের ডেটা একত্রে সংরক্ষণ এবং পরিচালনা করতে ব্যবহৃত হয়।


Arrays

আর প্রোগ্রামিং-এ Array একটি মাল্টি-ডাইমেনশনাল ডেটা স্ট্রাকচার যা সমজাতীয় (Homogeneous) ডেটা ধারণ করতে সক্ষম। এটি সাধারণত সংখ্যাসূচক (Numerical) ডেটা ধারণ করে এবং একাধিক ডাইমেনশন (যেমন, রো (row), কলাম (column)) ধারণ করতে পারে।

Arrays এর বৈশিষ্ট্য

  • মাল্টি-ডাইমেনশনাল: Arrays এক বা একাধিক ডাইমেনশন ধারণ করতে পারে, যেমন ১D, ২D, ৩D ইত্যাদি।
  • একই ধরনের ডেটা: Arrays শুধুমাত্র একই ধরনের (যেমন, সংখ্যাসূচক, ক্যারেক্টার) ডেটা ধারণ করতে পারে।
  • Indexing: Arrays এ প্রতিটি উপাদানকে ইনডেক্স ব্যবহার করে অ্যাক্সেস করা যায়।

Array তৈরি করা

আর-এ একটি অ্যারে তৈরি করার জন্য array() ফাংশন ব্যবহার করা হয়। উদাহরণ:

# 1D array
arr1 <- array(1:6, dim = c(3, 2))  # ৩টি রো এবং ২টি কলাম

# 2D array
arr2 <- array(1:12, dim = c(3, 4)) # ৩টি রো এবং ৪টি কলাম

Array এর ব্যবহার

arr1[1,2]  # ১ম রো এবং ২য় কলামের মান
arr2[2,3]  # ২য় রো এবং ৩য় কলামের মান

Data Frames

Data Frame হলো একটি বিশেষ ধরনের ডেটা স্ট্রাকচার যা R-এ ডেটা বিশ্লেষণ ও ম্যানিপুলেশনের জন্য অত্যন্ত জনপ্রিয়। এটি বিভিন্ন ধরণের ডেটা (যেমন, সংখ্যাসূচক, ক্যারেক্টার, তারিখ ইত্যাদি) একত্রে ধারণ করতে পারে এবং এটি একটি টেবিলের মতো সাজানো থাকে, যেখানে প্রতিটি কলাম আলাদা ধরনের ডেটা ধারণ করতে পারে।

Data Frame এর বৈশিষ্ট্য

  • মিশ্র ধরনের ডেটা: Data Frame এ বিভিন্ন ধরনের ডেটা যেমন সংখ্যা, ক্যারেক্টার, তারিখ ইত্যাদি একত্রে রাখা যায়।
  • রো ও কলাম: Data Frame এ ডেটা টেবিল আকারে থাকে, যেখানে রো (row) গুলি পর্যবেক্ষণ এবং কলাম (column) গুলি ভেরিয়েবল নির্দেশ করে।
  • আরও সহজ ডেটা ম্যানিপুলেশন: Data Frame R-এ ডেটা বিশ্লেষণ এবং ম্যানিপুলেশনের জন্য সহজে ব্যবহারযোগ্য হয়।

Data Frame তৈরি করা

R-এ একটি Data Frame তৈরি করার জন্য data.frame() ফাংশন ব্যবহার করা হয়। উদাহরণ:

# Data frame তৈরি করা
df <- data.frame(
  Name = c("John", "Sara", "Peter"),
  Age = c(23, 25, 22),
  Salary = c(3000, 3500, 4000)
)

Data Frame এর ব্যবহার

# কলাম অ্যাক্সেস করা
df$Name  # Name কলামের ডেটা

# রো অ্যাক্সেস করা
df[1,]   # ১ম রো
df[ ,2]  # ২য় কলাম

Data Frame এ নতুন কলাম যোগ করা

# নতুন কলাম যোগ করা
df$Gender <- c("Male", "Female", "Male")

Arrays এবং Data Frames এর মধ্যে পার্থক্য

বৈশিষ্ট্যArraysData Frames
ডেটার ধরনএকই ধরনের ডেটা (Homogeneous)ভিন্ন ধরনের ডেটা (Heterogeneous)
ডাইমেনশনএক বা একাধিক ডাইমেনশন (Multi-dimensional)এক বা একাধিক কলাম এবং রো
ব্যবহারসংখ্যা, বৈজ্ঞানিক ডেটা ইত্যাদিডেটা বিশ্লেষণ, ভেরিয়েবল ম্যানিপুলেশন
কর্মপ্রবাহসাধারণত গাণিতিক বা পরিসংখ্যানগত কাজটেবিল আকারে ডেটা বিশ্লেষণ এবং ম্যানিপুলেশন

সারাংশ

Arrays এবং Data Frames দুটি গুরুত্বপূর্ণ ডেটা স্ট্রাকচার যা R প্রোগ্রামিং ভাষায় ডেটা সংরক্ষণ এবং ম্যানিপুলেশনের জন্য ব্যবহৃত হয়। Arrays মাল্টি-ডাইমেনশনাল সমজাতীয় ডেটা ধারণ করে, যেখানে Data Frames মিশ্র ধরনের ডেটা ধারণ করে এবং এটি টেবিল আকারে থাকে। Data Frames পরিসংখ্যানগত বিশ্লেষণ এবং ডেটা ম্যানিপুলেশনের জন্য একটি শক্তিশালী টুল, যা Arrays এর তুলনায় অধিক ব্যবহারিক এবং কার্যকর।

Content added By
Promotion

Are you sure to start over?

Loading...